产品描述生成是一项具有挑战性且探索不足的任务。大多数这样的工作都采用一组产品属性,因为输入然后在单个通行证中从头开始生成描述。但是,在面对用户在约束描述时的动态愿望时,这种广泛的范式可能会受到限制,例如根据先前版本删除或添加用户指定属性的内容。为了应对这一挑战,我们在描述生成中探索了一种新的草稿编辑方式,从而导致了电子商务中提议的新任务控制文本编辑。更具体地说,我们允许系统从用户接收命令(删除或添加),然后通过基于上一个版本灵活修改内容来生成描述。通过修改以前的版本而不是从头开始,满足新需求更容易,更实用。此外,我们设计了一种数据增强方法,以纠正此任务中的低资源挑战,其中包含一种基于模型的基于规则的策略,以模仿人类的编辑。为了遵循这项新任务,我们介绍了一个人为编写的命令编辑数据集,称为e-cedits和一个新的指标“属性编辑”。我们的实验结果表明,在自动和人类评估中,使用新的数据增强方法在更大程度上优于基准。
translated by 谷歌翻译
卷积神经网络(CNN)已被证明在肺结核检测领域非常有效。但是,现有的基于CNN的肺结核检测方法缺乏捕获长期依赖性的能力,这对于全局信息提取至关重要。在计算机视觉任务中,非本地操作已被广泛使用,但是对于3D计算机断层扫描(CT)图像,计算成本可能很高。为了解决这个问题,我们提出了一个长的短切片网络(LSSANET),用于检测肺结核。特别是,我们开发了一种称为长短切片组(LSSG)的新的非本地机制,该机制将紧凑的非本地嵌入分裂为一个短距离切片,分组为一和长距离切片。这不仅减轻了计算负担,而且还可以在切片和整个功能图中保持长期依赖性。提出的LSSG易于使用,可以插入许多肺结核检测网络中。为了验证LSSANET的性能,我们将基于2D/3D CNN的几种最近提出的竞争检测方法进行比较。大规模PN9数据集的有希望的评估结果证明了我们方法的有效性。代码在https://github.com/ruixxxx/lssanet上。
translated by 谷歌翻译
3D肺部片段的重建在肺癌的外科治疗计划中起着重要作用,这有助于保存肺功能并有助于确保低复发率。但是,在深度学习时代,肺部段的自动重建仍未得到探索。在本文中,我们研究了是什么使肺部段自动重建。首先,我们在临床和几何上表达了肺部段的解剖学定义,并提出了遵守这些定义的评估指标。其次,我们提出了脉冲(隐式肺部段),这是一种旨在肺部段重建的深层隐式表面模型。通过脉冲自动重建肺部段的指标和视觉吸引力是准确的。与规范分割方法相比,冲动输出连续预测任意分辨率具有较高的训练效率和更少的参数。最后,我们尝试不同的网络输入,以分析肺部段重建任务中重要的事情。我们的代码可在https://github.com/m3dv/impulse上找到。
translated by 谷歌翻译
人类注释是不完美的,尤其是在初级实践者生产的时候。多专家共识通常被认为是黄金标准,而这种注释协议太昂贵了,无法在许多现实世界中实施。在这项研究中,我们提出了一种完善人类注释的方法,称为神经注释细化(接近)。它基于可学习的隐式函数,该函数将潜在向量解码为表示形状。通过将外观整合为隐式函数的输入,可以固定注释人工制品的外观可见。我们的方法在肾上腺分析的应用中得到了证明。我们首先表明,可以在公共肾上腺细分数据集上修复扭曲的金标准。此外,我们开发了一个新的肾上腺分析(ALAN)数据集,其中拟议的附近,每个病例都由专家分配的肾上腺及其诊断标签(正常与异常)组成。我们表明,经过近距离修复的形状训练的型号比原始的肾上腺更好地诊断肾上腺。 Alan数据集将是开源的,具有1,594个用于肾上腺诊断的形状,它是医学形状分析的新基准。代码和数据集可在https://github.com/m3dv/near上找到。
translated by 谷歌翻译
来自光学相干断层扫描(OCT)B扫描的投影图(PM)是诊断视网膜疾病的重要工具,这通常需要视网膜层分割。在这项研究中,我们提出了一个新颖的端到端框架,以预测B扫描的PM。我们没有明确地将视网膜层分割,而是将它们隐式表示为预测的坐标。通过在视网膜层之间均匀采样的坐标上进行像素插值,可以通过合并轻松获得相应的PMS。值得注意的是,所有操作员都是可区分的。因此,这种可区分的投影模块(DPM)可以通过PMS的基础真理而不是视网膜层分割来实现端到端训练。我们的框架产生了高质量的PM,明显超过了基线,包括没有DPM的香草CNN和基于优化的DPM,而没有深层之前。此外,拟议的DPM是曲线/表面之间区域/体积的新神经表示,对于几何深度学习可能具有独立的兴趣。
translated by 谷歌翻译
我们介绍了MedMnist V2,这是标准化生物医学图像的大规模MNIST样数据集集合,包括12个用于2D的数据集和3D的6个数据集。所有图像均已预处理成28x28(2D)或28x28x28(3d)的小尺寸,并带有相应的分类标签,因此用户不需要背景知识。涵盖生物医学图像中的主要数据模式,MedMnist V2旨在对具有各种数据集量表(从100到100,000)和多种任务(二进制/多级,序数回归和多标签)进行轻巧的2D和3D图像进行分类。最终的数据集由708,069个2D图像和10,214个3D图像组成,可以支持生物医学图像分析,计算机视觉和机器学习中的许多研究 /教育用途。我们在MedMnist V2上基准了几种基线方法,包括2D / 3D神经网络和开源 /商用汽车工具。数据和代码可在https://medmnist.com/上公开获取。
translated by 谷歌翻译
有许多方法可以使用弱监管来培训网络到分段2D图像。相比之下,现有的3D方法依赖于3D图像卷的2D片的子集的全监督。在本文中,我们提出了一种真正无弱监督的方法,即我们只需要在目标对象的表面上提供一组稀疏的3D点,这是一项可以快速完成的便捷任务。我们使用3D点以使3D模板变形,使其大致与目标对象轮廓匹配,并且我们介绍了利用粗略模板提供的监控以培训网络以找到准确边界的体系结构。我们评估我们在计算机断层扫描(CT),磁共振图像(MRI)和电子显微镜(EM)图像数据集中的方法的性能。我们将表明,在减少监督成本下,它始终以3D弱监管方式表现出更传统的方法。
translated by 谷歌翻译
Deep neural networks (DNNs) are found to be vulnerable to adversarial attacks, and various methods have been proposed for the defense. Among these methods, adversarial training has been drawing increasing attention because of its simplicity and effectiveness. However, the performance of the adversarial training is greatly limited by the architectures of target DNNs, which often makes the resulting DNNs with poor accuracy and unsatisfactory robustness. To address this problem, we propose DSARA to automatically search for the neural architectures that are accurate and robust after adversarial training. In particular, we design a novel cell-based search space specially for adversarial training, which improves the accuracy and the robustness upper bound of the searched architectures by carefully designing the placement of the cells and the proportional relationship of the filter numbers. Then we propose a two-stage search strategy to search for both accurate and robust neural architectures. At the first stage, the architecture parameters are optimized to minimize the adversarial loss, which makes full use of the effectiveness of the adversarial training in enhancing the robustness. At the second stage, the architecture parameters are optimized to minimize both the natural loss and the adversarial loss utilizing the proposed multi-objective adversarial training method, so that the searched neural architectures are both accurate and robust. We evaluate the proposed algorithm under natural data and various adversarial attacks, which reveals the superiority of the proposed method in terms of both accurate and robust architectures. We also conclude that accurate and robust neural architectures tend to deploy very different structures near the input and the output, which has great practical significance on both hand-crafting and automatically designing of accurate and robust neural architectures.
translated by 谷歌翻译
Incorporating large-scale pre-trained models with the prototypical neural networks is a de-facto paradigm in few-shot named entity recognition. Existing methods, unfortunately, are not aware of the fact that embeddings from pre-trained models contain a prominently large amount of information regarding word frequencies, biasing prototypical neural networks against learning word entities. This discrepancy constrains the two models' synergy. Thus, we propose a one-line-code normalization method to reconcile such a mismatch with empirical and theoretical grounds. Our experiments based on nine benchmark datasets show the superiority of our method over the counterpart models and are comparable to the state-of-the-art methods. In addition to the model enhancement, our work also provides an analytical viewpoint for addressing the general problems in few-shot name entity recognition or other tasks that rely on pre-trained models or prototypical neural networks.
translated by 谷歌翻译
公平的聚类旨在将数据分为不同的簇,同时防止敏感属性(例如性别,种族,RNA测序技术),而不是主导聚类。尽管最近已经进行了许多作品并取得了巨大的成功,但其中大多数是启发式的,并且缺乏算法设计的统一理论。在这项工作中,我们通过开发一种相互信息理论来填补这一空白,以实现深度公平的聚类,并因此设计出一种称为FCMI的新型算法。简而言之,通过最大化和最大程度地减少共同信息,FCMI旨在通过深度公平的聚类(即紧凑,平衡和公平的簇)以及信息丰富的特征来实现四种特征。除了对理论和算法的贡献外,这项工作的另一个贡献是提出了一个基于信息理论的新颖的公平聚类指标。与现有的评估指标不同,我们的指标以整体而不是单独的方式来衡量聚类的质量和公平性。为了验证拟议的FCMI的有效性,我们对六个基准进行了实验,包括单细胞RNA-seq Atlas,而与11种最先进的方法相比,就五个指标而言。认可后将发布代码。
translated by 谷歌翻译